지시 조정 모델로의 전환
기반이란 무엇인가요?
과거에는 기본형 LLM이 방대한 데이터를 바탕으로 시퀀스에서 다음 단어를 예측하도록 주로 훈련되었습니다. 그러나 개발자에게 진정한 힘은 지시 조정형 LLM. 이러한 모델들은 사용자 피드백을 통한 강화 학습(РЛХФ)을 통해 특정 명령을 따르고 유용한 보조 역할을 하도록 개선됩니다.
황금 법칙:LLM을 똑똑하지만 직관적인 인턴처럼 대하세요. 당신의 구체적인 맥락을 모르기 때문에 목표를 명확히 표현해야 합니다.
핵심 원칙을 적용하는 방법
- 명확성과 구체성: 명확성이 간결함을 의미하지는 않습니다. 더 많은 맥락을 제공하고 구분자 (삼중 백틱이나 XML 태그와 같은 것들)를 사용하면 모델이 지시사항과 처리해야 할 데이터를 구별할 수 있습니다.
- 모델에게 생각할 시간을 주세요: 복잡한 작업은 사고의 사슬을 필요로 합니다. 모델에게 바로 결론을 내리라고 요청하면 추론 오류를 범할 가능성이 높습니다. 먼저 스스로 해결책을 찾아내도록 지시하세요.
허위 정보 생성을 피하세요
모델은 '타당해 보이는' 하지만 잘못된 정보를 생성할 수 있습니다. 항상 사실을 확인하거나 모델에게 출처를 제시하도록 지시하여 이 위험을 줄이세요.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Why should a developer prefer an Instruction Tuned LLM over a Base LLM for building an application?
Challenge: Generating Structured Data
Apply prompting principles to format output.
You have a list of ingredients. You need to convert this list into a JSON format for a web app.
Task
Write a prompt that requests JSON output with keys for 'item' and 'quantity'. Include a condition check: If the input is not a recipe, output "No recipe detected."
Solution:
prompt = "You will be provided with text. If it contains a recipe, convert it to JSON with keys 'item' and 'quantity'. If not, write 'No recipe detected.' Text: <user_input>"